EFM-DBSCAN: Ein baumbasierter Clusteringalgorithmus unter Ausnutzung erweiterter Leader-Umgebungen
نویسنده
چکیده
DBSCAN ist ein dichte-basierter Clusteringalgorithmus, der beliebig geformte Cluster erkennt und sie von Rauschen trennt. Aufgrund der Laufzeit von O(n2) ist seine Anwendung jedoch auf kleine Datenkollektionen beschränkt. Um diesen Aufwand zu reduzieren, wurde der auf dem Konzept der Leader-Umgebung basierende Algorithmus FM-DBSCAN vorgestellt, der für beliebige Metriken dasselbe Clustering wie DBSCAN liefert. In dieser Arbeit wird nun basierend auf FM-DBSCAN das Verfahren EFM-DBSCAN entwickelt. EFM-DBSCAN nutzt die folgenden zwei Konzepte zur Eizienzsteigerung: (a) eine baumbasierte Partitionierung und (b) die Erweiterung der Objekte einer Leader-Umgebung um die Distanzen zu ihrem Leader. Erste Experimente zeigen, dass EFM-DBSCAN bis zu einem Faktor 17 weniger Distanzberechnungen und bis zu einem Faktor 13 weniger Rechenzeit als FM-DBSCAN benötigt. Gegenüber DBSCAN wurde ein Faktor von bis zu 104 eingespart.
منابع مشابه
FM-DBSCAN: Ein effizienter, dichte-basierter Clustering-Algorithmus
DBSCAN ist ein dichte-basierter Clustering-Algorithmus, der Cluster beliebiger Form auffindet und diese von Rauschen trennt. Aufgrund des quadratischen Aufwands ist DBSCAN für große Datenmengen jedoch oft ungeeignet. In dieser Arbeit wird deshalb ein effizienterer Algorithmus namens FM-DBSCAN vorgestellt, der für eine beliebige Distanzfunktion (Metrik) dasselbe Ergebnis wie DBSCAN liefert. Hier...
متن کاملDezentrale Steuerung verteilter Anwendungen mit rationalen Agenten
Herkömmliche Methoden für die Steuerung und Koordination verteilter Anwendungen mit weitgehend autonomen Diensten und Prozessen in heterogenen, sich dynamisch ändernden Umgebungen beruhen oft auf zentralen Steuerungskomponenten und statischen Zustandsund Prozessbeschreibungen. Sie berücksichtigen damit sowohl die Autonomie der Teilprozesse als auch die Dynamik des Anwendungskontextes noch zu we...
متن کاملMethoden zum Schutz von Verkehrsdaten in Funknetzen
Die Verwendung elektromagnetischer Wellen für die Übertragung von Daten im freien Raum birgt Probleme bezüglich des Datenschutzes. Daher sucht das vorliegende Papier unter dem Aspekt des technischen Datenschutzes nach Möglichkeiten, die Peilung von aktiven Sendeeinrichtungen, hier spezieller Mobilfunksender, zu verhindern. Das angestrebte Ziel ist, die Nichtortbarkeit einer Mobilstation und dam...
متن کاملDie (technischen) Potenziale digitaler Tafeln
Dieser Beitrag erläutert die technischen Potenziale digitaler Tafeln, mit denen mehr und mehr Schulen ausgestattet werden. In einer Betrachtung aktueller Nutzungsszenarien dieser interaktiven Whiteboards wird herausgearbeitet, dass ein Großteil dieser Potenziale noch ungenutzt ist und die Defizite der Software insbesondere für den Einsatz in einem anspruchsvollen, schülerorientierten Unterricht...
متن کامل"Gefällt mir" - Anreicherung von kontextspezischem Endbenutzer-Feedback um die Meinungen, Ideen und Bewertungen Anderer in sozialen Netzwerken
Das Requirements Engineering kann heutzutage durch neue Technologien unterstützt werden bspw. durch die Benutzung von Smartphones [5, 6]. Unter Ausnutzung des Kontext können Endbenutzer Feedback geben, um sich an der Verbesserung von Systemen, zum Beispiel in ITÖkosystemen [2], zu beteiligen. Dieses Feedback ist mehr oder weniger willkürlich, d.h. aus der Situation heraus ohne Bezug zu anderem ...
متن کامل